搜索资源列表
ChineseWordSegmentation
- 总结了在过去的十年间中文自动分词技术的进展-the study in automatic Chinese word segmentation ,during the last decade
fenci
- 中科院分词,自动分词,java实现,内附说明谢谢使用-zhongkeyuanfenci
Test Class By SVM
- 支持向量机实现的文本分类程序,过程如下,首先使用分词工具分词,这里使用的是计算所的分词工具,从而保证分词是最优秀的,接下来使用国际效率最高的文本IFIDF向量生成工具生成文本相量,最后使用台湾林智恒的效率最高的SVM实现软件包libsvm实现训练和分类,可以这么说,该文本分类是同类中效率最高最准确的-text classfication source code use 3 technology.words sementation,vector gerneration,and libsvm too
SunMap
- 从底层实现的GIS小项目,具有地图的放大、缩小、平移等常用地图操作功能和查询功能等,可以读取多种常用几何类型的shapefile文件,项目中还含有一个MMSeg中文分词器,适合GIS专业的同学科研使用-GIS from the underlying implementation of small projects, with maps, zoom, pan and other commonly used map operation functions and query functions, y
MySearch
- lucene htmlparser paoding customSpider webservice 一个完整的基于lucene工具包和庖丁分词加自定义实现爬虫分析数据的搜索引擎,少量改动即可使用-lucene htmlparser paoding customSpider webservice a complete tool kits and Paoding lucene-based word plus a custom analysis of data to achieve a search
java
- java最大正向匹配算法 帮助大家了解分词原理-java maximum matching algorithm to help you understand the positive word principle
Index_Query
- 可以对pdf,doc,txt,html实现全文检索。用了中科院的ictloc分词器,分词效率较高-Can be pdf, doc, txt, html to achieve full-text search. With the Chinese Academy of Sciences of ictloc Word Breaker, efficient word
WordSeg
- 实现基本分词,对刚开始接触中文分词的人,是很有帮助的。-To achieve the basic word, the first contact with Chinese word for people, is helpful.
PaoDing
- 中文分词软件——庖丁最新版本,可用于文本检索领域的分词等功能的实现-Chinese word segmentation software- Paoding latest version can be used for the sub-text retrieval functions of the realization of the word
ICTCLAS_JAVA
- 使用汉语分词系统ICTCLAS_JAVA版本进行中文分词、词性标注-Use of Chinese word segmentation system ICTCLAS_JAVA version of Chinese word segmentation, POS tagging
memrial
- 用java实现的一个类似于记事本的小程序。 实现功能添加记录、查询记录、修改记录、删除记录。无按钮,全由快捷键操作,这是根据本人的需求设置的。包含的技术,IK分词技术,lucence搜索技术,文件操作(容易修改为扩展为BDB轻量级数据库)-Use Java a similar to realize the notepad small programs.Functions added records, inquires the record, modify records, deleting
MyWordSpliter1
- java实现的分词程序,Nutch中文分词-java implementation of segmentation procedures
fenci
- 复旦的中文分词java程序包,装了eclipse话,导入项目就能用-Fudan University Chinese word java program package installed eclipse, then import the project will be able to use
Java-ICTCLAS
- java版中国科学院张华平博士的分词程序,开源java代码,仅供学习使用。国际评测很高,国内第一-java version of the Chinese Academy of Sciences, Dr. Zhang Huaping segmentation procedure, open source java code for educational purposes only. The international evaluation high, the first domestic
Java
- 能实现分词,去除停用词,统计词频的Java的源代码-To achieve segmentation, removal of stop words, word frequency statistics Java source code
java
- 用java实现的前向最大中文分词算法代码-Using java to achieve before the largest Chinese word segmentation algorithm code
自然语言处理的最好的资源
- python,java代码,可以完成分词,训练词向量,等功能,效果突出。
Split
- Java实现逆向最大匹配中文分词算法,本程序可以实现较为简单的中文分词-Java implementation reverse maximum matching Chinese word segmentation algorithm, the program can be implemented relatively simple Chinese word segmentation
ictclas4j
- 中科院分词Java版,根据C语言版改写-ictclas4j-Participles ictclas4j Java version of Chinese academy of sciences, in the C language version
InformationGain
- 使用java实现的信息增益算法,附带了一些训练样本,已经进行了分词-Java algorithm using information gain realized, with some training samples have been carried out participle